1 Introducción

2 Análisis de los métodos de enriquecimiento funcional

Términos totales Términos grandes %
ORA 11 6 54.55
GSEA 1646 132 8.02
elim 198 0 0.00
weight 151 2 1.32
PC 91 23 25.27
weight01 177 8 4.52

2.1 Resultados para ORA

2.1.1 Grafo

Grafo para los 20 términos más significativos de ORA. Abrir en nueva pestaña para ver en detalle.

2.1.2 Resultados

Enrichment plot de los 30 términos más significativos de ORA

2.1.3 Enrichment plot

2.2 Resultados para GSEA

2.2.1 Grafo

Grafo de los 20 términos más significativos para GSEA a mayor color mayor significancia. Los nodos rectangulares representan uno de los 20 términos. Abrir en nueva pestaña para ver en detalle.

2.2.2 Resultados

Enrichment plot de los 30 términos más significativos de GSEA

2.2.3 Enrichment Plot

2.3 Resultados para elim

2.3.1 Grafo

Grafo de los 10 términos más significativos para elim. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos.

2.3.2 Resultados

Enrichment plot de los 30 términos más significativos de elim

2.3.3 Enriquecimiento

2.4 Resultados para weight

2.4.1 Grafo

Grafo de los 10 términos más significativos para weight. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos. Abrir en nueva pestaña para ver en detalle.

2.4.2 Resultados

Enrichment plot de los 30 términos más significativos de weight

2.4.3 Enrichment Plot

2.5 Resultados para PC

2.5.1 Grafo

Grafo de los 20 términos más significativos para PC A mayor color mayor significancia. Los nodos rectangulares representan uno de los 20 términos. Abrir en nueva pestaña para ver en detalle.

2.5.2 Resultados

Enrichment plot de los 30 términos más significativos de PC

2.5.3 Enrichment Plot

2.6 Resultados para weight01

2.6.1 Grafo

Grafo de los 10 términos más significativos para weight01. A mayor color mayor significancia. Los nodos rectangulares representan uno de los 10 términos. Abrir en nueva pestaña para ver en detalle.

2.6.2 Resultados

Enrichment plot de los 30 términos más significativos de weight01

2.6.3 Enrichment Plot

2.7 Comparativas generales

2.7.1 Calidad de los términos y WSC

Tamaño medio para los términos significativos detectados por cada uno de los métodos

Distribución del IC detectado por cada método

Dichos términos redundantes presentan poco enriquecimiento y por tanto no son biológicamente tan relevantes. Para lidiar con ellos podemos hacer un proceso de filtrado o filtrado doble, y siempre previamente a la clusterizarión, pues de forma inversa la clusterización se vería sesgada por dichos términos.

El paso fundamental reside en la aplicación del WSC, que basándose en el pull total de genes de interés seleccionará aquellos términos con mejor p-valor que en conjunto representen a todo el pull de genes de interés. Este algoritmo no suele tener mucha potencia si se usa de forma aislada, sin embargo, si lo empleamos como una herramienta adicional para el filtrado previo a la clusterización vamos a conseguir una mejor calidad de los clusters. Pese a ello en nuestros datos existen aún términos generales que abarcan una gran cantidad de genes, de forma que alteran el funcionamiento de WSC y pueden afectar negativamente al resultado, por ello antes de aplicar WSC es buena idea eliminar todos aquellos términos con un tamaño superior a 1000 g/t, obteniendo los siguientes resultados.

Estandar
WSC
WSC + Filtrado
Nº Términos Enriquecimiento Nº Términos Enriquecimiento Nº Términos Enriquecimiento
Fisher 11 2.22 10 2.27 5 2.88
GSEA 1646 1.01 749 1.38 627 1.42
elim 198 5.84 193 5.77 193 5.77
weight 151 6.06 148 6.00 146 6.06
PC 91 3.36 90 3.37 67 4.05
weight01 177 5.56 172 5.46 164 5.66

En la tabla superior vemos que si usamos WSC de forma aislada conseguimos descartar algunos términos para todos los métodos; principalmente GSEA que presenta una clara mejoría; sin embargo, su efecto no es muy destacable y en algunos casos incluso empeora el enriquecimiento medio. Al combinar WSC con un filtrado de los términos generales obtenemos unos mejores resultados en todos los casos, con un claro incremento de enriquecimiento en los métodos tradicionales y una sutil mejora en los métodos de control.

2.7.2 Medida PO

Utilizando el porcentaje de solapamiento (PO):

\[ (PO) = \bigg(\frac{\frac{k}{L_1}+\frac{k}{L_2}}{2}\bigg)*100 \]

Siendo k el número de términos compartidos por ambos métodos a comparar, L1 el número de términos del primer métodos y L2 los del segundo. Con ello podemos conocer cuantos términos comparten entre sí los distintos métodos.

Heatmap de las medidas PO para los 6 métodos de enriquecimiento funcional

2.7.3 Solapamiento de términos

Relación entre los términos de ORA, GSEA y PC

Relación entre los términos de elim, weight y weight01

Relación entre los 6 métodos de enriquecimiento

3 Clusterizado de los resultados

3.1 Resultados de ORA

3.1.1 Heatmaps

3.1.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.1.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.1.2 Tablas

3.1.2.1 Tabla estandar

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 0 0
5-20 términos 0 0
< 5 términos 7 5
Tamaño medio 1 2
Total 7 5

3.1.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 0 0
5-20 términos 0 0
< 5 términos 4 4
Tamaño medio 1 1
Total 4 4

3.1.3 Resultados

3.1.3.1 SE

Clusterizado mediante simplifyEnrichment para ORA

3.1.3.2 REVIGO

Clusterizado mediante REVIGO para ORA

3.1.3.3 SE - WSC

3.1.3.4 REVIGO - WSC

3.2 Resutados GSEA

3.2.1 Heatmaps

3.2.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.2.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.2.2 Tablas

3.2.2.1 Tabla estandar

Resultados del clusterizado para GSEA
simplifyEnrichment REVIGO
> 20 términos 9 24
5-20 términos 6 24
< 5 términos 22 28
Tamaño medio 44 21
Total 37 76

3.2.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 10 8
5-20 términos 3 20
< 5 términos 17 26
Tamaño medio 20 11
Total 30 54

3.2.3 Resultados

3.2.3.1 SE

Clusterizado mediante simplifyEnrichment para GSEA

3.2.3.2 REVIGO

Clusterizado mediante REVIGO para GSEA

3.2.3.3 SE - WSC

3.2.3.4 REVIGO - WSC

3.3 Resultados elim

3.3.1 Heatmaps

3.3.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.3.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.3.2 Tablas

3.3.2.1 Tabla estandar

Resultados del clusterizado para elim
simplifyEnrichment REVIGO
> 20 términos 3 1
5-20 términos 2 13
< 5 términos 6 16
Tamaño medio 18 6
Total 11 30

3.3.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 3 1
5-20 términos 2 13
< 5 términos 16 15
Tamaño medio 9 6
Total 21 29

3.3.3 Resultados

3.3.3.1 SE

Clusterizado mediante simplifyEnrichment para elim

3.3.3.2 REVIGO

Clusterizado mediante REVIGO para elim

3.3.3.3 SE - WSC

3.3.3.4 REVIGO - WSC

3.4 Resultados weight

3.4.1 Heatmaps

3.4.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.4.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.4.2 Tablas

3.4.2.1 Tabla estandar

Resultados del clusterizado para weight
simplifyEnrichment REVIGO
> 20 términos 2 1
5-20 términos 4 8
< 5 términos 9 18
Tamaño medio 10 5
Total 15 27

3.4.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 2 1
5-20 términos 4 7
< 5 términos 13 19
Tamaño medio 7 5
Total 19 27

3.4.3 Resultados

3.4.3.1 SE

Clusterizado mediante simplifyEnrichment para weight

3.4.3.2 REVIGO

Clusterizado mediante REVIGO para weight

3.4.3.3 SE - WSC

3.4.3.4 REVIGO - WSC

3.5 Resultados PC

3.5.1 Heatmaps

3.5.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.5.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.5.2 Tablas

3.5.2.1 Tabla estandar

Resultados del clusterizado para weight
simplifyEnrichment REVIGO
> 20 términos 0 0
5-20 términos 3 4
< 5 términos 41 35
Tamaño medio 2 2
Total 44 39

3.5.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 0 0
5-20 términos 4 3
< 5 términos 16 29
Tamaño medio 3 2
Total 20 32

3.5.3 Resultados

3.5.3.1 SE

Clusterizado mediante simplifyEnrichment para weight

3.5.3.2 REVIGO

Clusterizado mediante REVIGO para weight

3.5.3.3 SE - WSC

3.5.3.4 REVIGO - WSC

3.6 Resultados weight01

3.6.1 Heatmaps

3.6.1.1 Heatmaps estandar

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.6.1.2 Heatmaps WSC

Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento Relación entre los 50 términos más significativos para los 6 métodos de enriquecimiento

3.6.2 Tablas

3.6.2.1 Tabla estandar

Resultados del clusterizado para weight01
simplifyEnrichment REVIGO
> 20 términos 3 1
5-20 términos 3 11
< 5 términos 13 16
Tamaño medio 9 6
Total 19 28

3.6.2.2 Tabla WSC

Resultados del clusterizado para ORA
simplifyEnrichment REVIGO
> 20 términos 3 1
5-20 términos 2 9
< 5 términos 10 18
Tamaño medio 10 5
Total 15 28

3.6.3 Resultados

Clusterizado mediante simplifyEnrichment para weight01

3.6.3.1 SE

3.6.3.2 REVIGO

Clusterizado mediante REVIGO para weight01

3.6.3.3 SE - WSC

3.6.3.4 REVIGO - WSC

4 Conclusiones

4.1 Número de clusters

4.1.1 Clusterizado estandar

4.1.2 Clusterizado con WSC

4.2 Distribución de clusters

4.2.1 Clusterizado estandar

4.2.2 Clusterizado con WSC

4.3 Tabla comparativa

4.3.1 Tabla estandar

IC medio Media de clusters Media de tamaño Total términos
ORA 3.537291 6.0 1.5 11
GSEA 4.688392 56.5 32.5 1646
elim 6.541702 20.5 12.0 198
weight 6.071653 21.0 7.5 151
PC 3.139707 41.5 2.0 91
weight01 7.034649 23.5 7.5 177

4.3.2 Tabla WSC

IC medio Media de clusters Media de tamaño Total términos
ORA 4.544161 4.0 1.0 5
GSEA 4.018821 42.0 15.5 627
elim 6.442057 25.0 7.5 193
weight 6.256874 23.0 6.0 146
PC 4.098294 26.0 2.5 67
weight01 6.737700 21.5 7.5 164